РИО: Эксперты обсудили применение искусственного интеллекта в сферах истории и культуры
17 февраля 2026 года в Доме РИО состоялся круглый стол, посвящённый вопросам информационного суверенитета и применения искусственного интеллекта в сферах истории и культуры. Его участники обсудили, как можно использовать нейросети в археологии, музейном деле и архивной отрасли, а также затронули вопрос обучения больших языковых моделей на основе верифицированных научных фактов.
Дискуссию открыл Председатель Российского исторического общества Сергей Нарышкин. Он отметил, что в прошлом году к помощи нейросетей обращались более половины российских интернет-пользователей, а потому принципиально важно, чтобы ответы нейросетей были объективными и достоверными. Для этого необходимо системно обучать российские языковые модели с опорой на верифицированные данные о нашей культуре, истории, традициях и ценностях.
Напомним, в начале этого года Президент России Владимир Путин поручил подготовить при участии ассоциации «Альянс в сфере искусственного интеллекта», федерального государственного бюджетного учреждения «Российская академия наук», Российской библиотечной ассоциации, Всероссийской общественной организации «Русское географическое общество», Ассоциации «Российское историческое общество» и представить предложения по обучению российских больших мультимодальных моделей с использованием данных о российских культуре, истории, традициях и ценностях, а также о результатах отечественных научных исследований.
По словам Председателя РИО, возможность быстро обрабатывать огромные массивы архивных данных, которую даёт искусственный интеллект, чрезвычайно важна для достижения целей исторического просвещения:
«Для профессиональных историков появление искусственного интеллекта тоже стало серьёзным подспорьем. Например, в Институте археологии Российской академии наук методы “машинного обучения” уже применяются для выявления признаков авторских стилей в керамике. Результаты этого оригинального эксперимента существенно ускорят и упростят процессы атрибуции подобных находок».
Также Сергей Нарышкин отдельно коснулся вопросов оцифровки исторических документов и обучения студентов-гуманитариев навыкам использования современных технологий:
«Как вы знаете, в Архивном фонде Российской Федерации — более 550 миллионов единиц хранения. Работа по их переводу в электронный вид стартовала ещё четверть века назад, однако оцифровано пока что лишь около 3% от всего массива источников. Не говорю уже о том, что большая часть этих “оцифрованных” документов попросту отсканирована, а значит, не распознаётся поисковыми системами. Так что, если мы всерьёз хотим использовать все преимущества искусственного интеллекта в работе с историческими источниками, то темпы оцифровки следует нарастить.
Кроме того, необходимо задуматься о подготовке кадров. Нынешних студентов-гуманитариев — историков, архивистов, музееведов — уже нельзя учить по старинке, как раньше. Следует вооружать их актуальными цифровыми инструментами, обучать использовать их в работе. Где-то это может потребовать пересмотра рабочих программ, а где-то – переподготовки преподавательского состава».
Тему необходимости оцифровки архивного наследия России продолжил сопредседатель РИО, заместитель Министра науки и высшего образования Российской Федерации Константин Могилевский. Он отметил, что единственный путь, позволяющий конкурировать с зарубежными генеративными моделями, предполагает обучение отечественных нейросетей на тех наборах данных, которых в интернете ещё нет. В свою очередь, основными держателями таких данных являются российские библиотеки и архивы.
Кроме того, Константин Могилевский предложил использовать современные технологии для изучения документов Екатерины II, 300-летие со дня рождения которой будет отмечаться в 2029 году:
«Через три года нам предстоит отпраздновать 300-летие со дня рождения Екатерины Великой. Период её правления был временем бурных социальных изменений. Менялись границы страны, осваивались новые территории — Сибирь, Новороссия, Крым, Польша. Всё это хорошо задокументировано — в наших архивах отложились огромные массивы источников. Полагаю, что реализация исследовательских проектов, призванных обработать это колоссальное наследие с применением цифровых технологий, стала бы не только вкладом в работу юбилейного оргкомитета, но и наглядным свидетельством состоятельности отечественной исторической науки».
Напомним, образованный Правительством России организационный комитет по подготовке и проведению празднования 300-летия со дня рождения Екатерины II возглавляют Председатель Российского исторического общества Сергей Нарышкин и заместитель Председателя Правительства Российской Федерации Татьяна Голикова.
Большой опыт в обучении студентов навыкам использования искусственного интеллекта накоплен в Высшей школе экономики. Об этом сообщил ректор НИУ ВШЭ Никита Анисимов, отметивший, что в 2017 года в университете действует проект цифровой грамотности, в рамках которого студенты бакалавриата осваивают алгоритмику, программирование, анализ данных и основы искусственного интеллекта:
«Мы ежегодно трансформируем дисциплины цифровой грамотности, расширяем блок по так называемому промпт-инжинирингу. На образовательных программах по востоковедению, юриспруденции и другим дисциплинам студенты имеют возможность изучать анализ данных, причём в проектном формате».
«Начав с проекта “Цифрового Петра”, мы пошли дальше. При подготовке историков-студентов вовлекали их в очень серьёзные проекты и использовали искусственный интеллект для изучения массовых однотипных исторических источников, таких, как комплекс материалов по учёту населения и имущественным сделкам в Москве в первой половине XVIII века. С помощью отечественных генеративных моделей — прежде всего это GigaChat, Kandinsky, YandexGPT — мы создавали и апробировали программу, которая позволяет размечать и автоматически извлекать из источника информацию по определённым социальным категориям. В рамках линейки обязательных дисциплин по цифровой гуманитаристике у наших студентов-историков есть использование моделей [искусственного интеллекта] при решении исследовательских задач», — добавил он.
«Digital Пётр» — разработанный в преддверии 350-летия со дня рождения Петра I РИО, фондом «История Отечества» и Сбером проект, который позволяет за несколько секунд получить в удобном и понятном формате расшифровку рукописей Петра Первого. С помощью технологии глубокого обучения на основе петровских текстов авторы проекта адаптировали параметры нейросети под конкретную задачу распознавания почерка императора. Благодаря технологиям компьютерного зрения, обработки естественного языка и графы знаний разработчикам проекта удалось добиться качества расшифровки в 97%.
Идею оцифровки наследия Екатерины II с помощью искусственного интеллекта поддержал вице-президент — директор Департамента развития искусственного интеллекта и машинного обучения ПАО «Сбербанк» Максим Ерёменко, рассказавший о том, как выстроен процесс обучения больших языковых моделей искусственного интеллекта: «Команда Сбера готова с привлечением самых последних разработок поддерживать развитие технологий в интересах отечественной истории. Кажется крайне важным для наших школьников, студентов дать такой инструментарий, который, фактически, позволит по-новому пересмотреть подход к изучению истории и где-то с элементами геймификации, где-то элементами интерактивного взаимодействия повысит интерес к историческому домену для нашего молодого поколения».
Промежуточными результатами проекта «Поиск по архивам» поделился директор по связям с органами государственной власти бизнес-группы Поисковых сервисов и ИИ, директор проектов «Поиск по архивам» и «Языки народов России» ООО «Яндекс» Александр Болховитянов: «В 2023 году мы запустили наш проект “Поиск по архивам”, который направлен на привлечение интереса пользователей, жителей нашей страны к истории своей семьи. <…> Мы даём людям возможность искать информацию об истории своей семьи в документах XIX века, иногда XVIII века. За три года у нас сформировалась значительная коллекция документов: 24 региона уже к этому проекту подключились, 22 миллиона сканов документов [добавлено]. Мы разработали уникальную в мировом масштабе технологию распознавания документов, написанных дореформенной орфографией. Это позволяет нам, наряду с традиционной оцифровкой, которая сейчас применяется во многих учреждениях, когда создаётся по сути только изображение, электронная копия документа, переводить его в машиночитаемый вид, который впоследствии можно использовать при обучении больших языковых моделей».
Оцифровке архивного наследия нашей страны посвятил своё выступление член Совета РИО, статс-секретарь — заместитель руководителя Федерального архивного агентства Андрей Юрасов. Один из масштабных информационных проектов агентства, требующих активизации работа по оцифровке и создающих широкие возможности для применения искусственного интеллекта — это государственная информационная система удалённого использования архивных документов, полностью введённая в эксплуатацию в сентябре 2025 года.
«Система является единой точкой доступа к ресурсам федеральных архивов. В отдельном модуле она объединила справочно-поисковый аппарат 13 федеральных архивов — это машиночитаемые заголовки почти 24 миллионов единиц хранения, что составляет более 50% от всех заголовков дел, хранящихся в федеральных архивах, и предоставляет возможности контентного поиска. Коммерческий модуль обеспечивает удалённый доступ к электронным копиям архивных документов. В настоящее время в систему загружено более 14 миллионов образов. Поэтапно предполагается пополнить систему практически всеми имеющимися в федеральных архивах электронными копиями документов», — подчеркнул Андрей Юрасов.
При этом, отметил он, повышение темпов оцифровки требует системного целевого финансирования.
Оцифровка архивных фондов является комплексным и трудоёмким процессом. Перед началом непосредственного сканирования документов специалисты проводят экспертизу, определяют структуру исследуемого архивного фонда, качественные и количественные характеристики документов, выбирают технологию и оборудование для сканирования. На следующем этапе производится создание графических образов документов с помощью сканеров, результатом которого являются электронные копии документов, которые затем каталогизируются и записываются на носители информации. Ключевая стадия оцифровки — распознавание текста документов, позволяющее при дальнейшей работе с архивными фондами легко находить и изучать интересующий источник. Наиболее эффективно расшифровывают документы программы, основанные на технологиях искусственного интеллекта.
Профессиональные историки уже активно используют искусственный интеллект в своей работе. Например, в Институте археологии РАН на основе методов машинного обучения разрабатывается методика выявления «авторского почерка» в древних керамических изделиях, а также идёт работа над нейросетевой языковой моделью, предназначенной для генерирования автоматических тестовых описаний археологических предметов по их изображениям. Сотрудниками Института истории материальной культуры РАН с помощью искусственного интеллекта проведена виртуальная реконструкция уничтоженной Триумфальной арки Пальмиры, а также создана геоинформационная система древней Пальмиры. А коллективу Государственного исторического музея, применяя новейшие технологии, удалось восстановить целостную форму ценного музейного экспоната — погребальной маски, относящейся к таштыкской археологической культуре.
Текст: Михаил Дорофеев
Российское историческое общество
Рубрика: Новости
Дата: 19-02-2026